Token layering /分層

Token 分層是一種透過精心組合原始 token(詞或短語)來精確表達使用者意圖的技術,就像使用樂高積木搭建結構一樣。AI依賴這些 token 來理解使用者的提示並生成響應。此模式是一種通用的輸入方式,與人類自然交流的方式非常接近。

定義與操作方法 (Definition and Operation)

Token 分層的核心在於,使用者選擇和組合特定詞語,使其攜帶更多關聯意義,從而幫助 AI 精確解讀輸入內容。例如:不同表達方式對語氣和意義的影響:

透過有意組合 token,可以強化 AI 對提示的理解,並最佳化生成內容。例如,在影象生成中,使用者常列出加權 token 來控制風格和方向,這種方法在創意頭腦風暴中非常高效。

實踐與變體

Token 分層技術不斷演進,逐步融入更直觀、使用者友好的介面設計中,以下為常見形式:

  1. 直觀的開放式提示與分層 token 的結合:例如 Adobe Firefly 提供一個開放式輸入框,同時配備易於選擇的風格化、結構化和引用性 token 面板。在音樂生成器(如 Udio)中,使用者可以從視覺化工具中選擇特定音調或風格。
  1. 後續互動式 token 採集:工具可以在初始提示後生成追問,例如 Jasper 和 Perplexity 會自動生成跟進問題作為新的輸入 token,從而逐步捕獲使用者意圖。這種方法能減輕使用者在初始輸入時的負擔,提升使用者體驗。
  1. 結果後的 token 調整建議:AI 生成結果後提供修改選項,使用者可選擇預設列表(如 Grammarly 和 Notion)或從當前上下文中自動生成建議。這種遞進式的互動模式降低了使用者的學習成本。

案例與互動模式

優勢 (Positives)

風險 (Potential Risks)

Jasper會自動生成後續提示,引導使用者輸入額外的識別符號(tokens)以指導生成內容。(透過這種方式,Jasper能更有效地捕捉使用者意圖,最佳化生成內容的相關性和質量。)
Figjam也採用了漸進式披露的設計,但其建議的識別符號(tokens)是固定的。(這種設計透過逐步引導使用者選擇固定的引數,為內容生成提供方向,同時簡化使用者決策過程。)
Grammarly依賴一組固定的後續提示來捕捉額外的識別符號(tokens),例如語氣、聲音和目標受眾。(這種固定結構的後續提示幫助使用者快速定義寫作風格和目標,從而提升生成內容的匹配度。)
Udio和其他音訊生成工具將開放式提示與特定的識別符號(tokens)提示相結合,以便在第一次嘗試時就生成接近預期的結果。(這種結合方法既允許使用者自由表達需求,又透過明確的引數引導生成內容,使得輸出更加精準。

Zapier的影象生成模板包含一個提示,要求使用者新增有關風格和描述的識別符號(tokens)。(透過這種設計,使用者可以明確指定生成影象的視覺風格和內容特性,從而提高生成結果的精準度。)

Perplexity在使用者輸入第一個提示後會生成後續提示,以捕獲額外的識別符號(tokens),而這些後續提示是自動生成的。(這種動態互動方式透過逐步引導使用者提供更多細節,從而生成更相關、更準確的結果。)